課程名稱 |
統計與機器學習 Statistical and Machine Learning |
開課學期 |
109-2 |
授課對象 |
公共衛生學院 流預所生物醫學統計組 |
授課教師 |
王彥雯 |
課號 |
EPM7012 |
課程識別碼 |
849 M0960 |
班次 |
|
學分 |
3.0 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期三2,3,4(9:10~12:10) |
上課地點 |
公衛118 |
備註 |
與蕭朱杏合授 限本系所學生(含輔系、雙修生) 總人數上限:30人 外系人數限制:2人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/1092EPM7012_SML |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
本課程將介紹常見的統計學習方法及相關理論,範圍將涵蓋監督式學習(supervised learning)、非監督式學習(unsupervised learning)、維度縮減(dimension reduction)、regularized regression、ensemble learning等,並搭配R或Python的操作,引入實際問題的處理與分析,培養學生從資料中了解問題,並擷取有用的資訊以解決實際問題的能力。 |
課程目標 |
本課程將介紹常見的統計與機器學習方法及其理論,同時搭配實例分析與程式撰寫,期望學生修習完後能具備分析資料及正確解讀分析結果之能力。 |
課程要求 |
修課學生必須具備統計學、迴歸分析之基礎。 |
預期每週課後學習時數 |
|
Office Hours |
另約時間 |
指定閱讀 |
1. James, G., Witten, D., Hastie, T., and Tibshirani, R. (2013). An Introduction to Statistical Learning with Applications in R. Springer.
2. Hastie, T., Tibshirani, R. and Friedman, J. (2016). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd edition. Springer.
|
參考書目 |
1. Abu-Mostafa, Y. S., Magdon-Ismail, M. and Lin, H.-T. (2012). Learning from Data: a Short Course. AMLBook.
2. Alpaydin, E. (2014). Introduction to Machine Learning, 3rd edition. MIT Press Ltd.
3. Summa, M. G., Bottou, L., Goldfarb, B., Murtagh, F., Pardoux, C. and Touati, M. (2012). Statistical Learning and Data Science. Chapman and Hall/CRC.
4. Lantz, B. (2019). Machine Learning with R : Expert techniques for predictive modeling, 3rd edition. Packt Publishing.
5. Wickham, H. and Grolemund, G. (2017). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media.
6. Muller, A. C. and Guido, S. (2016). Introduction to Machine Learning with Python: A Guide for Data Scientists. O'Reilly Media.
7. 塚本邦尊、山田典一 、大澤文孝著,莊永裕譯 (2020)。東京大學資料科學家養成全書:使用 Python 動手學習資料分析。臉譜出版。 |
評量方式 (僅供參考) |
No. |
項目 |
百分比 |
說明 |
1. |
平時表現、課堂參與、作業練習 |
40% |
|
2. |
期中報告或期中考 |
25% |
|
3. |
期末口頭報告 |
15% |
|
4. |
期末書面報告 |
20% |
|
|
週次 |
日期 |
單元主題 |
第1週 |
2/24 |
Introduction: what is statistical and machine learning? |
第2週 |
3/03 |
Overview of supervised learning (蕭朱杏老師) |
第3週 |
3/10 |
Data visualization (臺北大學統計學系 吳漢銘副教授) |
第4週 |
3/17 |
Regression: linear regression |
第5週 |
3/24 |
Regression: regularized regression -- ridge regression, LASSO, elastic-net |
第6週 |
3/31 |
Classification: logistic regression, k-nearest neighbors |
第7週 |
4/07 |
Classification: Bayesian decision theory, discriminant analysis |
第8週 |
4/14 |
Classification: support vector machines (I) |
第9週 |
4/21 |
Classification: support vector machines (II) & Support vector regression |
第10週 |
4/28 |
Tree-based methods -- regression trees, classification trees, random forests |
第11週 |
5/05 |
期中報告 |
第12週 |
5/12 |
Model assessment: evaluation, cross-validation, bootstrap |
第13週 |
5/19 |
Ensemble learning: boosting, bagging, stacking, cascading |
第14週 |
5/26 |
Neural networks |
第15週 |
6/02 |
Other supervised learning methods |
第16週 |
6/09 |
期末口頭報告 |
第17週 |
6/16 |
期末口頭報告 |
第18週 |
6/23 |
期末考週 |
|